Variabili che non si possono osservare direttamente \(\rightarrow\) Variabili Latenti (e.g., Intelligenza, Depressione, Ansia, Estroversione)
Inferite dagli indicatori \(\rightarrow\) Variabili Osservate (e.g., risposte alle matrici di Raven)
Osserviamo Giorgio e vediamo che Giorgio:
ha tanti amici
è contento quando ha tante persone intorno
cerca sempre di rimanere in contatto con le persone
partecipa a tanti eventi sociali
\(\ldots\)
I comportamenti di Giorgio (Variabili osservate) sono spiegabili sulla base del costrutto latente (variabile latente) estroversione
Modelli matematici che permettono di collegare le variabili latenti con le variabili manifeste
Assunzioni:
Le variabili latenti sono la “causa” della variabilità nelle variabili osservate
Indipendenza Locale: Una volta presa in considerazione l’effetto della variabile latente, la correlazione tra le variabili manifeste svanisce
Sia i modelli dell’IRT sia la Classical Test Theory (CTT) hanno come obiettivo la misurazione delle persone
Stabilire la posizione delle persone sul tratto latente di interesse e il loro ordinamento
IRT
Focus \(\rightarrow\) Items
CTT
Focus \(\rightarrow\) Test
La probabilità di una risposta osservata (variabile manifesta) dipende sia dalle caratteristiche della persona sia dalle caratteristiche dell’item
Le caratteristiche della persona possono essere descritte da un parametro relativo alla persona \(\rightarrow\) Costrutto Latente (e.g., intelligenza, Ansia, ecc.)
Le caratteristiche dell’item possono essere descritte da uno o più parametri (difficoltà, discriminatività, guessing, careless error)
Le caratteristiche degli item e della persona stanno sullo stesso tratto latente
Diversi modelli IRT a seconda del:
Monotonicità
Unidimensionalità
Se le assunzioni vengono violate, il modello può sempre essere fittato, ma la sua interpretazione e l’interpretazione delle sue stime sono prive di significato
La probabilità di rispondere correttamente agli item aumenta all’aumentare del livello del tratto latente
Se questa assunzione viene violata, si hanno dei problemi a livello di validità e attendibilità della misura
L’assunzione di unidimensionalità indica che un solo tratto latente è responsabile delle risposte agli item
Matrici di correlazione per testare l’unidimensionalità
L’assunzione di indipendenza locale indica che non esiste alcuna relazione tra le risposte di un soggetto ad item diversi dopo aver controllato per il tratto latente
Matrice di correlazione tra i residui standardizzati
Le caratteristiche delle persone e degli item si trovano sullo stesso tratto latente
Al variare della distanza sul tratto latente, la probabilità di osservare una risposta positiva cambia
(Nella maggior parte dei casi) Quando il parametro relativo alla persona e il parametro relativo all’item sono uguali si ha il 50% di probabilità di osservare una risposta positiva
Si distinguono in base al numero di parametri che descrivono le caratteristiche degli item:
Modello logistico a un parametro (one-parameter logistic model; 1PL) Analogo al modello di Rasch (a un GLM…)
Modello logistico a due parametri (two-parameter logistic model; 2PL)
Modello logistico a tre parametri (three-parameter logistic model; 3PL)
Modello logistico a quattro parametri (four-parameter logistic model; 4PL; usato raramente)
\[P(x_{pi} = 1| \theta_p, b_i) = \dfrac{\exp(\theta_p - b_i)}{1 + \exp(\theta_p - b_i)}\]
Misura della precisione con cui ogni item misura diversi livello del tratto latente
\[IIF_i(\theta) = P_i(\theta,b_i)Q_i(\theta, b_i)\]
dove chiaramente \(Q = 1−P_i(\theta_i,b_i)\) è la probabilità di risposta errata all’item \(i\)
Valore massimo quando \(\theta_p = b_i\) \(\rightarrow\) \(P(x_{pi}=1) = P(x_{pi}=0) =0.50\) \(\rightarrow\) \(\max IIF_i = .25\)
Qualsiasi item è più informativo per i soggetti con abilità uguale alla location dell’item \(\rightarrow\) al crescere della distanza tra soggetto e item, cala l’informatività
Tanti soggetti con livelli diversi di abilità \(\rightarrow\) item con livelli di difficoltà distribuiti lungo tutto il continuum latente
IRT
Meglio item con difficoltà diverse, sparpagliate lungo tutto il tratto latente
CTT
Meglio item con difficoltà omogenee
Restituisce una misura dell’accuratezza con cui il test misura complessivamente il tratto latente:
\[TIF(\theta) = \sum_{i=1}^{I} IIF_i(\theta, b_i)\]
La TIF permette di prevedere l’accuratezza con cui è possibile misurare ogni livello di tratto latente
Simile al concetto di attendibilità in CTT
Descrive la precisione della misurazione:
\[SEM(\theta) = \sqrt{\dfrac{1}{TIF(\theta)}}\] Maggiore è l’informazione, minore è il SEM
Minore è l’informazione, maggiore è il SEM
A differenza della CTT, non si assume che l’errore di misura sia uguale per tutti i soggetti
\[P(x_{pi} = 1|\theta_p, b_i, a_i) = \frac{\exp[a_i(\theta_p - b_i)])}{1 + \exp[a_i(\theta_p - b_i)]}\]
\[IIF_i(\theta) = a_i^2P_i(\theta, b_i, a_i)Q_i(\theta, b_i, a_i)\]
\[P(x_{pi} = 1| \theta_p, b_i, a_i) = c_i + (1 - c_i) \dfrac{\exp[a_i(\theta_p - b_i)]}{1+\exp[a_i(\theta_p - b_i)]}\]
Il parametro \(c_i\) è lo pseduo-guessing: Quando \(\theta \to -\infty\), \(P(x_{pi} = 1) = c_i\)
\[P(x_{pi}= 1| \theta_p, b_i, a_i, c_i, d_i) = c_i + (d_i -c_i) \dfrac{\exp[a_i(\theta_p - b_i)]}{1 + \exp[a_i(\theta_p - b_i)]}\]
Il parametro \(d_i\) è la careless error: Quando \(\theta \to +\infty\), \(P(x_{pi}) = d_i\)
\[\text{IIF}_{i}(\theta) = \dfrac{a_i^2[P(\theta)-c_i]^2[d_i - P(\theta)]^2}{(d_{i}-c_i)^2 P(\theta)Q(\theta)}\]
Fissando \(d_i = 1\) \(\forall i\) \(\rightarrow\) si ottiene il 3-PL dal 4-PL
Fissando \(c_i = 0\) \(\forall i\) \(\rightarrow\) si ottiene il 2-PL dal 3-PL
Fissando \(a_i = 1\) \(\forall i\) \(\rightarrow\) si ottiene l’1-PL dal 2-PL
Sono tutti modelli annidati!
\[P(x_{pi} = 1 |\theta_p,b_i) = \dfrac{\exp (\theta_p -b_i)}{1+ \exp (\theta_p -b_i)}\]
A livello matematico, il modello di Rasch e l’1-PL sono la stessa cosa
Come filosofia sottostante, sono due modelli completamente diversi
1-PL
Si osserva la fit del modello ai dati \(\rightarrow\) Il modello si adatta ai dati e si può scegliere il modello migliore dati i dati
Rasch
Si osserva la fit dei dati al modello \(\rightarrow\) Il modello è “vero”, vanno modificati i dati per farli stare dentro al modello
…Ma alcuni sono utili
Il modello può essere scelto:
A priori:
A posteriori:
Confronto a posteriori basato sugli indici di fit comparativi
\(-2\)LogLikelihood: Differenza tra la LogLikelihood di due modelli annidati
Akaike’s Information Criterion
Bayesian Information Criterion
Lezione @ Milano-Bicocca